## [1] "Nuestra base de datos tiene 21477 observaciones"
## [1] "Se obtienen 14271 listados y 121 variables después de limpieza, quitar NA's y creación de variables"
Se obtienen datos de 21,477 listados en la CDMX para enero 2020. Siguiendo a (Cai et al., 2019) se filtran los listados con al menos una opinión (comentario) en los últimos 6 meses garantizando que los listados estuvieran “activos” al momento del estudio. Además, se remueven todas las observaciones con valores de NA en alguna variable, resultando en 121 variables y 14,271 observaciones.
| Variable | Descripción | Fuente / Proceso |
|---|---|---|
| Precio | Precio por noche (se transforma a log para regresión) | Inside Airbnb |
| Listado entero | Variable dicotómica: 1 = toda la casa / apto., 0 = no toda la casa / apto. | Inside Airbnb. Creada a partir del tipo de hapitación/casa |
| Huéspedes permitidos | Número máximo de huéspedes permitidos | Inside Airbnb |
| Habitaciones | Número de habitaciones | Inside Airbnb |
| Baños | Número de baños completos y medios | Inside Airbnb |
| Amenidades | Índice aditivo: “Family Friendly” + “Business Ready” + Desayuno + Estacionamiento + Wi-Fi + CableTV + Piscina + Ascensor + Gimnasio + Portero + Lavadora + Licuadora + Calefacción + … |
Inside Airbnb. Índice creado a partir de extracción de texto en descripción. |
| Política de reservación | Índice aditivo: Flexibilidad de cancelación + Con noches mínimas + Tarifa de limpieza + Requerir que el huesped tenga documento verificado | Inside Airbnb. Índice creado a partir de dummies de requerimientos. |
| Localización | Distancia media (fórmula Haversine) al Punto de Interés (PDI) más cercano. Selección de 10 puntos más visitados de CDMX | Tripadvisor para elección de PDI y Google Maps para datos geográficos. |
| Competencia | Número de competidores con mismo número de habitaciones en una distancia de 400 m. (fórmula Haversine) | Inside Airbnb. Cálculo a partir de ubicación de listado. |
| Delincuencia | Número de Delitos de Bajo Impacto, Robos a casa habitación, Robo con/sin violencia y Robos a transeúnte con/sin violencia |
Portal de datos de la CDMX. Carpetas de investigación FGJ |
| Acceso transporte | Distancia Distancia media (fórmula Haversine) a estación de transporte colectivo Metrobús o Metro |
Portal de datos de la CDMX. Líneas y estaciones de Metrobús. Estaciones de Metro |
| Anfitrión profesional | Anfitrión con más de dos listados registrados | Inside Airbnb |
| Estatus Superhost | Dummy de certificado Superhost otorgado por Airbnb | Inside Airbnb |
| Promedio de calificación | Clasificación global (promedio sobre 100) | Inside Airbnb |
| Descripción | Presentación del anfitrión (medido en caracteres) | Inside Airbnb. Creado a partir de extensión de texto de descripción. |
| Antigüedad | Tiempo transcurrido desde que el listado se registró en la plataforma (medido en días) | Inside Airbnb. Diferencia entre fecha de registro y fecha de extracción. |
| Experiencia | Tiempo transcurrido desde que el anfitrión se registró en la plataforma (medido en días) | Inside Airbnb. Diferencia entre fecha de registro y fecha de extracción. |
| Número de comentarios | Reviews realizadas por huéspedes | Inside Airbnb |
| Sentimiento de comentarios | Reviews positivas y negativas (análisis de sentimiento en reviews con diccionario propio. En proceso) | Inside Airbnb. Creado a partir de análisis de texto para las Reviews. |
| Variable | Total / Promedio | Profesionales | No Profesionales | t-test medias |
|---|---|---|---|---|
| Listados | 14,271 | 5,930 | 8,341 | NA |
| 42% | 58% | |||
| Listados registrados | 5.67 | 11.82 | 1.30 | p-value |
| se | 0.09 | 0.18 | 0.01 | 0.000 |
| Precio | 968.39 | 1,102.72 | 872.89 | p-value |
| se | 6.60 | 11.75 | 7.43 | 0.000 |
| Precio/ persona | 318.84 | 341.50 | 302.74 | p-value |
| se | 1.78 | 2.86 | 2.25 | 0.000 |
| Listado (hab/casa) entero | 0.59 | 0.58 | 0.59 | p-value |
| se | 0.00 | 0.01 | 0.01 | 0.233 |
| Huéspedes permitidos | 1.79 | 1.90 | 1.71 | p-value |
| se | 0.01 | 0.02 | 0.01 | 0.000 |
| Habitaciones | 1.45 | 1.47 | 1.43 | p-value |
| se | 0.01 | 0.02 | 0.01 | 0.029 |
| Baños | 1.40 | 1.46 | 1.36 | p-value |
| se | 0.01 | 0.02 | 0.01 | 0.000 |
| Amenidades del listado | 24.64 | 25.65 | 23.92 | p-value |
| se | 0.08 | 0.13 | 0.10 | 0.000 |
| Flexible (1=flexible,0=estricto) | 0.87 | 0.90 | 0.86 | p-value |
| se | 0.00 | 0.00 | 0.00 | 0.000 |
| Distancia de PDI (metros) | p-value | |||
| se | ||||
| Competencia | p-value | |||
| se | ||||
| Delincuencia | p-value | |||
| se | ||||
| Acceso transporte | p-value | |||
| se | ||||
| Superhost | 0.46 | 0.53 | 0.42 | p-value |
| se | 0.00 | 0.01 | 0.01 | 0.000 |
| Calificación (max 100) | 95.62 | 94.91 | 96.13 | p-value |
| se | 0.05 | 0.07 | 0.06 | 0.000 |
| Descripción anfitrión (caracteres) | 190.46 | 240.63 | 154.79 | p-value |
| se | 2.75 | 5.01 | 3.02 | |
| Antigüedad listado (días) | 615.31 | 611.63 | 617.92 | p-value |
| se | 4.11 | 6.63 | 5.22 | 0.451 |
| Antigüedad anfitrión (días) | 1,320.02 | 1,395.91 | 1,266.07 | p-value |
| se | 6.05 | 9.64 | 7.69 | 0.000 |
| Reviews totales | 31.92 | 34.79 | 29.87 | p-value |
| se | 0.32 | 0.54 | 0.39 | 0.000 |
| Reviews último mes (Dic 2019) | 16.03 | 17.78 | 14.79 | p-value |
| se | 0.15 | 0.26 | 0.19 | 0.000 |
| Reviews positivas | p-value | |||
| se | ||||
| Reviews negativas | p-value | |||
| se |
Se identifica a un anfitrión profesional como aquel con más de dos \(>2\) listados registrados activos (Cai et al., 2019). En algunos otros artículos como (Lladós-Masllorens et al., 2020) se considera profesional a cualquier anfitrión con más de un listado registrado \(>1\). No hay un consenso al respecto. Nos quedamos con el criterio más estricto de \(>2\) listados.
La hipótesis es que un anfitrión con más listados no es una persona que busque sólo un ingreso adicional rentando su propiedad, sino un agente profesional que considera su actividad en Airbnb como un negocio administrando múltiples propiedades y por tanto su fijación de precios está más informada.
El mapa a continuación muestra los listados profesionales y listados no profesionales.
Podemos acercarnos con el zoom a cada zona.
.
## png
## 2
.
## [1] "Listo"
## 2.5 GB
El Colegio de México, https://diego-eco.github.io/toolkit.html↩︎